Mẫu ngẫu nhiên đơn

Trong thống kê, một mẫu ngẫu nhiên đơn là một tập hợp con của các cá thể (một mẫu) được lựa chọn từ một tập hợp lớn hơn (một quần thể). Mỗi cá thể được chọn ngẫu nhiên và hoàn toàn tình cờ, như vậy là mỗi cá thể đều có cùng xác suất bị chọn ở các giai đoạn trong quá trình lấy mẫu, và mỗi tập hợp con của k cá thể này có cùng xác suất được chọn mẫu như bất kỳ tập con của k cá thể khác. Quá trình kỹ thuật này được gọi là lấy mẫu ngẫu nhiên đơn, và không nên nhầm lẫn với lấy mẫu ngẫu nhiên hệ thống. Một mẫu ngẫu nhiên đơn là một kỹ thuật khảo sát không thiên vị.Như vậy đây là mẫu mà tất cả các thể trong quần thể có cùng cơ hội để chọn vào mẫu. Và là dạng đơn giản nhất của mẫu xác suất.Lấy mẫu ngẫu nhiên đơn là một loại hình cơ bản của việc lấy mẫu, vì nó có thể là một phần của phương pháp lấy mẫu khác phức tạp hơn. Các nguyên tắc lấy mẫu ngẫu nhiên đơn là mỗi đối tượng có cùng xác suất được chọn. Ví dụ, giả sử sinh viên đại học N muốn có được một vé cho một trò chơi bóng rổ, nhưng chỉ có X <N vé cho họ, vì vậy họ quyết định có một cách công bằng để xem ai được đi. Sau đó, tất cả mọi người được đưa ra một số trong khoảng từ 0 đến N -1, và số ngẫu nhiên được tạo ra, bằng điện tử hoặc từ một bảng các số ngẫu nhiên. Số bên ngoài phạm vi từ 0 đến N -1 được bỏ qua, giống như bất kỳ con số đã chọn trước đó. Các con số X đầu tiên sẽ xác định người chiến thắng vé may mắn.Cụ thể hơn để chọn một mẫu ngẫu nhiên đơn ta cần lập danh sách toàn bộ những đơn vị trong quần thể mà muốn rút ra một mẫu; chọn đơn vị mẫu sẽ được lấy vào mẫu, sử dụng phương pháp bốc thăm hoặc sử dụng bảng số ngẫu nhiên. Một ví dụ khác, giả sử một mẫu ngẫu nhiên đơn gồm 50 sinh viên được chọn từ một trường học có 250 sinh viên. Sử dụng danh sách của 250 sinh viên, mỗi sinh viên nhận một số thứ tự (từ 1 tới 250), và những số này được viết trên một mẫu giấy nhỏ. Toàn bộ nhữn mẫu giấy có số này được gập lại bỏ vào một cái hộp, lắc kỹ để đảm bảo là ngẫu nhiên. Tiếp theo, 50 mẫu giấy được lấy ra và số của chúng được ghi lại. Những sinh viên có những số này nằm trong mẫu nghiên cứuBảng số ngẫu nhiênLà một bảng tạo bởi 10 ký tự (0, 2, 3, …, 9) mà sự xuất hiện của mỗi ký tự trong bảng có tỉ lệ như nhau và không theo một trật tự nào, hoàn toàn ngẫu nhiên. Cho nên, nếu chọn một số từ một điểm ngẫu nhiên nào đó trên bảng thi bất kỳ một ký tự nào cũng có cơ hội như nhau được xuất hiện.Chẳng hạn, muốn chọn ngẫu nhiên một mẫu 200 trẻ trong một trường hợp có 625 trẻ để điều tra một vấn đề sức khỏe nào đó. 625 trẻ sẽ được đánh số thứ tự từ 1 đến 625 (khung mẫu). Như vậy, ta chỉ dùng 3 ký tự kế tiếp nhau trong bảng. Vào bảng một cách ngẫu nhiên (ví dụ: dùng đầu bút chì, không nhìn vào bảng, chấm vào một điểm nào đó trong bảng) bắt đầu từ điểm đó bằng một số có 3 ký tự, ví dụ điểm đó nằm vào bảng thứ 5 cột thứ ba của bảng ta đọc lần lượt theo chiều từ trên xuống dưới và từ trái qua phải, được các số 330, 369, 743, 273, 943, 002, 871, 918, 702, 318,… Chọn ra 200 số có 3 ký tự (không lấy các ký tự 000, các ký tự lớn hơn 625, chỉ lấy ra một lần, không lấy các ký tự lập lại); Như vậy ta đã có một mẫu 200 trẻMột lựa chọn ngẫu nhiên không thiên vị của cá thể là quan trọng do đó nếu một số lượng lớn các mẫu được rút ra, những mẫu trung bình sẽ đại diện cho chính xác dân số. Tuy nhiên, điều này không đảm bảo rằng một mẫu cụ thể là một đại diện hoàn hảo của quẩnf thể. Lấy mẫu ngẫu nhiên đơn giản chỉ cho phép một để rút ra kết luận bên ngoài giá trị về toàn bộ dân số dựa trên mẫu.Về mặt khái niệm, lấy mẫu ngẫu nhiên đơn giản là đơn giản nhất trong kỹ thuật lấy mẫu xác suất. Nó đòi hỏi một hoàn thiện khung lấy mẫu, trong đó có thể không có sẵn hoặc không khả thi để xây dựng cho các quần thể lớn. Thậm chí, nếu một khung hoàn chỉnh có sẵn, phương pháp tiếp cận hiệu quả hơn có thể thực hiện được nếu các thông tin hữu ích khác có sẵn về các đơn vị trong dân số.Ưu điểm của nó là dễ thực hiện, đòi hỏi kiến ​​thức tối thiểu để tiến hành. Chính sự đơn giản của nó cũng làm cho nó tương đối dễ dàng để giải thích các dữ liệu thu thập được. Đối với nhiều lý do khác nhau, lấy mẫu ngẫu nhiên đơn giản phù hợp nhất với tình huống mà không có nhiều thông tin sẵn có về dân số và thu thập dữ liệu có thể được tiến hành một cách hiệu quả vào các mặt hàng được phân phối ngẫu nhiên, hoặc trong trường hợp chi phí lấy mẫu là nhỏ đủ để làm cho hiệu quả ít quan trọng hơn so với sự đơn giản. Nếu những điều kiện này không giữ vững thì lấy mẫu phân tầng hoặc chọn mẫu cụm có thể là một lựa chọn tốt hơn.